LDA 토픽 모델링을 활용한 이벤트 스포츠 관광 경험 빅데이터 분석





서론

1.

연구의 필요성 및 목적

최근 문화체육관광부와 한국관광공사는 2024년을 스포츠 관광 활성화의 원년으로 삼았다(이학주, 2024). 스포츠 관광(Sport tourism)이란 신체적 참여를 통한 스포츠 활동을 위해서, 스포츠 이벤트를 관람하기 위해서, 혹은 스포츠와 관련된 매력물을 돌아보기 위해서 일시적으로 거주지를 떠나는 여가 활동 중심의 여행을 의미한다(Gibson, 1998). 스포츠 관광은 국제적으로 빠르게 성장하고 있는 특수 관광 중 하나이며 지역 사회, 도시, 국가 경제 등에 기여한다(Alexandris & Kaplanidou, 2014). 스포츠 관광 시장의 규모는 2023년에 5,467억 달러로 평가되는 등 계속해서 성장하고 있으며, 그 중 “스포츠 이벤트”의 중요성이 높아지고 있다(Global Market Insight, 2024).

이벤트 스포츠 관광(Event sport tourism)이란 스포츠 이벤트 참여를 목적으로 하는 관광 활동을 의미한다(Gibson, 1998). 스포츠 이벤트는 단순히 운동선수들의 경기뿐만 아니라 하나의 지역 축제로 승화되어 문화적 교류, 지역 이미지 제고 등이 가능하다는 이점이 있다(박재환, 2011). 또한, 스포츠 이벤트 개최는 관광객 유치와 그들에게서 파생되는 소비를 통해 국가 및 지역 경제 활성화를 촉진하는 등의 긍정적인 유, 무형적 효과를 가지기에(Kim et al., 2022; 김대환, 김하니, 2019), 전 세계적으로 국가 및 도시들은 스포츠 이벤트를 개최하기 위하여 노력한다(O’Brien & Chalip, 2007). 대한민국은 동⋅하계 올림픽, 월드컵, 아시안게임, 세계육상선수권대회 등 다양한 스포츠 이벤트 개최지로 선정되었으며, 스포츠 이벤트를 성공적으로 개최한 스포츠 선진국의 이미지를 공고히 다지고 있다(김대환, 김방출, 2019; 김지훈, 김로빈, 2024).

이러한 중요성으로 인해, 이벤트 스포츠 관광과 관광객에 관한 연구는 스포츠 경영학, 경제학 등의 분야에서 다수 연구되었다. 구체적으로 권웅, 성윤태, 맹이섭(2016)은 투르 드 코리아 기간 동안 관람객의 소비를 바탕으로 지역 경제 파급효과를 분석하여 스포츠 이벤트 개최가 개최 지역의 생산, 부가가치, 고용 증대에 긍정적으로 기여한다고 밝혔다. 또한 민두식, 고정민, 이완영(2020)은 국제스포츠 이벤트 관람객의 체험과 지각된 가치, 관광 지역 이미지, 만족도, 행동 의도 간의 구조적 관계를 규명하여 스포츠 이벤트를 통한 지역 이미지 제고, 지역 관광 활성화 등의 긍정적인 효과를 제시하였다.

그 밖에도, 다양한 선행연구에서 이벤트 스포츠 관광의 중요성과 그로 인한 긍정적인 효과를 검증하여 학문적, 실무적 의의를 제시하였다. 그러나, 관련 선행연구에서는 스포츠 이벤트에 대한 인식을 개인의 주관적인 심리에 초점을 맞춰 이해하는 등 미시적인 관점에서 효과성을 검증했다는 한계점을 지니고 있다. 스포츠 이벤트의 규모 특성상, 개개인의 관점을 통해 스포츠 이벤트를 이해하려는 미시적 접근보다 사회적 차원에서 전반적인 스포츠 이벤트를 이해할 수 있는 거시적 접근이 적절할 수 있다. 따라서, 본 연구는 거시적인 관점에서 빅데이터를 활용하여 특정 스포츠 이벤트에 대한 관광객의 인식과 실질적인 경험을 바탕으로 관광객들이 해당 스포츠 이벤트와 함께 어떠한 요인들에 관심을 가지고, 스포츠 이벤트에 대해 어떠한 담론을 형성하는지 파악하고자 한다.

빅데이터 분석이란(Big data analysis) 일반적인 데이터베이스의 용량을 초과하는 대용량의 데이터로부터 가치를 추출하고 결과를 분석하는 기술을 의미한다(류시영, 유선욱, 2017). 과거에 비해 현대 사회의 데이터는 빠른 속도로 생성되며, 다양한 형태로 형성되는 등의 특징을 가지고 있어 빅데이터를 활용한 분석 기술이 다양해지고 있다(이정학, 이재문, 김재환, 김형근, 2017). 특히 빅데이터 분석은 특정한 집단이 아닌 사회 전체의 다양한 인식과 현황을 파악하는데 적절하며(최현주, 최연철, 2016), 미시적 관점에서 불가능했던 새로운 정보와 가치를 도출할 수 있다는 장점이 있다(장지명, 황성화, 2021). 이에 따라 사회, 경제, 정치, 과학 등 다양한 영역에서 활발하게 빅데이터 분석이 진행되고 있으며, 체육학 분야에서도 빅데이터 분석 기술을 적용하여 새로운 지식을 도출하려는 시도가 증대되고 있는 추세이다(이희지, 김지훈, 이준성, 2022).

특히, 스포츠 관광의 활성화 방안을 도출하기 위하여 빅데이터를 활용한 대중들의 인식과 트렌드 등을 분석한 연구가 다수 수행되고 있다. 구체적으로, 김종성(2017)은 빅데이터를 활용하여 “스포츠 관광”, “레저스포츠”, “스키”, “자전거” 등과 관련된 연관어를 탐색하였으며, 연구 결과를 통해 빅데이터 분석과 관련 선행연구의 결과가 유사하다는 점을 확인하여 빅데이터 분석을 신뢰성을 제시하였다. 김민수, 오승욱, 한진욱(2019)의 연구에서는 소셜 미디어 빅데이터를 활용하여 레저스포츠관광의 트렌드를 분석하였다. 연구 결과, 레저스포츠관광의 버즈량은 블로그에서 가장 높게 나타났으며 가장 많이 언급되었던 종목은 자전거, 낚시, 캠핑 순서로 나타났다. 마지막으로 최주현, 엄진종(2024)의 연구에서는 빅데이터를 활용하여 텍스트 마이닝 및 CONCOR 분석을 기반으로 충청남도의 스포츠 관광 트렌드와 중심성 및 군집을 도출하였다. 이를 통해 기간 별 주요 키워드를 도출하였으며, e스포츠 대회 등 스포츠 대회가 관광 산업의 발전 전략이 될 수 있음을 제시하였다.

이렇듯 다양한 선행연구에서 스포츠 관광에 대한 빅데이터 분석을 수행하고 있지만, 대부분의 연구들은 신체적 참여를 통한 스포츠 관광에만 초점이 맞춰져 있다는 한계점을 지니고 있다. 몇몇 선행연구에서는 스포츠 이벤트에 대한 빅데이터 분석을 수행하여 긍정적인 측면을 제시하고 있으나(김민수, 2023; 장지명, 황성화, 2021), ‘이벤트 스포츠 관광’에 대한 실질적인 빅데이터 분석은 미비한 실정이다. 스포츠 관광 분야에서 이벤트 스포츠 관광의 중요성이 부각되고 있는 현 상황에서, 이벤트 스포츠 관광에 대한 빅데이터 분석은 관광 및 스포츠 산업에 중요한 시사점을 제공할 수 있을 것으로 판단된다. 특히, 개인 단위로 진행되는 참여 스포츠 관광보다 대규모의 이벤트 스포츠 관광에 대하여 빅데이터 분석을 수행하는 것은 대중들의 전반적인 인식을 이해하는 데 도움이 될 수 있다.

따라서, 본 연구의 목적은 소셜 빅데이터를 활용하여 이벤트 스포츠 관광객의 실제 경험을 분석하는 것이다. 구체적인 목표는 다음과 같다: (1) 이벤트 스포츠 관광과 함께 나타나는 핵심 단어들을 도출하고, 핵심 단어 간의 연결 관계 및 구조를 분석한다. (2) 이벤트 스포츠 관광 경험 이후 스포츠 이벤트와 관련하여 어떠한 담론들이 형성되는지 탐색한다. (3) 스포츠 이벤트에 대한 이벤트 스포츠 관광객의 감정을 분석한다. 이를 통해 이벤트 스포츠 및 스포츠 관광 관련 실무자에게 실용적 시사점을 제시하여 이벤트 스포츠 관광 활성화에 기여할 수 있을 것으로 기대된다.

연구방법

1.

연구 대상 및 조사 도구

본 연구는 최근 한국에서 개최된 MLB 월드투어 서울시리즈를 대상으로 빅데이터 분석을 실시하였다. 자료 수집과 분석을 위하여 텍스톰(Textom)과 오픈 소스 통계 프로그램 R을 활용하였다. 텍스톰은 KrKwic(Korean KeyWords in Context) 프로그램을 기반으로 한 빅데이터 처리 솔루션으로 다양한 자료들을 검색하여 데이터 추출, 정제, 매트릭스 생산 등의 일괄 처리가 가능하기에 네트워크 분석 시 유용한 소프트웨어로 활용되고 있다(이희지 등, 2022). 본 연구에서는 텍스톰을 활용하여 네이버(Naver)와 다음(Daum)을 수집 채널로 선정하였으며, 이벤트 스포츠 관광 이후 관광객의 경험에 대한 데이터를 수집하기 위하여 블로그와 카페로 수집 범위를 지정하였다. 자료 수집을 위한 검색어는 스포츠 이벤트의 전반적인 인식을 분석하고 해당 스포츠 이벤트를 직접 관람한 소셜 빅데이터를 수집하기 위하여 “서울시리즈”, “서울시리즈 + 관람”, “서울시리즈 + 직관”으로 선정하였다. 자료 수집 기간은 실제 이벤트 첫 개최 날짜인 2024년 3월 17일부터 스포츠 이벤트에 대한 빅데이터 분석에 있어 불필요한 내용이 포함되지 않도록 연구자가 관람 후기 글을 직접 확인한 후 4월 17일까지로 지정하였다. 자료 분석은 단어 빈도 분석, TF-IDF, 의미 연결망 분석, LDA(Latent Dirichlet Allocation) 토픽 모델링, 감성 분석을 실시하였다.

2.

분석 방법

본 연구의 목적을 달성하기 위하여 텍스트 마이닝(text mining)을 통한 빅데이터 분석을 수행하였다. 텍스트 마이닝이란 자연어 처리 기술을 바탕으로 비정형 데이터(Unstructured data)로부터 패턴 및 관계 등 새로운 정보를 추출하는 기술이다(Hotho, Nürnberger & Paaß, 2005). 텍스트 마이닝은 다양한 분야에서 실무적, 학술적으로 빈번히 활용되어 빅데이터 분석 방법 중에서 가장 핵심적인 기술로 여겨지고 있다(이희지 등, 2022; 장재영, 2013). 본 연구에서 진행된 텍스트 마이닝 절차는 다음과 같다.

1)

데이터 전처리(Data Pre-processing)

우선, 분석을 위해 텍스톰을 활용하여 텍스트 데이터 전처리 과정을 거쳤다. 데이터 전처리란 데이터에 포함된 불필요한 요소들(Noise)을 수정 및 제거하는 과정을 의미한다(이준혁 등, 2019). 이러한 과정을 통해 불용어(Stop words), 특수 기호, 문장 부호, 공백 등을 제거함으로써 빅데이터 분석에 사용되는 데이터의 품질을 향상시킬 수 있다(빈삼, 염혜정, 심수인, 2021). 본 연구에서는 수집된 데이터에서 분석에 불필요한 단어들을 삭제하고(예: 것 등)이벤트 스포츠 관광과 관련이 없는 단어들을 제거하였다(예: 미술관, 등). 구체적인 데이터 정제의 예는 <표 1>과 같다.

표 1.

데이터 정제 과정


구분 데이터 정제
연구 목적에 부합하지 못함 미술관, 박물관, 전시회, 기안, 갤러리 등
분석에 불필요함 것, 중, 개, 곳, 의, 데 등
형태소 분석 과정에서
분리된 단어
월드투어(월드), 메이저리그(리그), 스카이돔(스카이), 챔피언스(챔피), 파드리스(파), 등
2)

단어 빈도 분석(Word Frequency Analysis)

단어 빈도 분석이란 해당 단어의 중요성을 나타내는 척도 중 하나로, 문서 내에서 단어가 얼마나 빈번하게 등장하는 지를 나타낸다(Julia & David, 2019). 본 연구에서는 단어 빈도 분석을 통해 출현 빈도가 가장 높은 단어 50개를 추출하였다. 다음으로, 단어들의 빈도를 직관적으로 시각화하기 위한 워드 클라우드(Word cloud) 분석을 수행하였다(빈삼 등, 2021). 워드 클라우드 분석이란 단어의 출현 빈도에 따라 서로 크기가 다르게 구름 형태로 표현하는 시각화 기법으로, 단어의 출현 빈도를 한 눈에 알 수 있도록 하는 방식이다(Youn & Lee, 2018). 워드 클라우드의 경우 출현 빈도가 높은 100개의 단어를 활용하여 시각화하였다. 본 연구에서는 이러한 분석 방법을 통해 이벤트 스포츠 관광과 함께 나타나는 단어들을 도출하였다.

3)

TF-IDF 분석(Term Frequency-Inverse Document Frequency)

단어의 출현 빈도가 높다고 해서 그 단어의 중요성이 높다고 판단하기에는 한계가 있다(이지혜, 이정학, 이재문, 2018). 따라서, 문서 상에서 공통적으로 나타나는 빈도를 함께 고려하여 특정 단어가 해당 문서의 특징을 얼마나 잘 반영하고 있는지에 따라 가중치를 부여하는 방법인 TF-IDF 분석을 실시하였다(Jing, Huang, & Shi, 2002). 우선 TF란 단어의 빈도(Term Frequnecy)로, 문서의 특정 주제와 관련된 단어 및 단어 조합이 등장하는 빈도를 의미한다. 그러나 이러한 빈도가 모든 문서에서 흔히 등장하는 경우, 단어의 가중치를 낮게 부여할 수 있는데 이를 IDF(Inverse Document Frequency)라 한다(이희지 등, 2022). 이러한 두 값을 곱하여 TF-IDF 값을 산출하며, 단순 횟수를 의미하는 TF 값보다 특정 단어가 얼마만큼 유의미한지를 나타낼 수 있기에 TF-IDF 값은 의미 있는 정보로 활용되고 있다(오산, 2023). 따라서, 본 연구에서는 TF-IDF 분석을 통해 이벤트 스포츠 관광과 관련성이 높은 핵심 단어들을 도출하였다.

4)

의미 연결망 분석(Semantic Network Analysis)

의미 연결망 분석이란 핵심 단어들 사이의 관계를 계량적으로 제시하여 연결망 구조로 표현하는 분석 방법으로, 두 개 이상의 키워드가 일정한 범위에서 동시 출현(Co-occurrence)하는 빈도를 계수화하는 것을 의미한다(정호윤, 2023). 구체적으로, 각각의 핵심 단어를 노드(Node)의 개념으로 놓고 단어 간의 연결 상태를 엣지(Edge)로 표현하며 이러한 링크가 얼마나 밀접한지를 나타내는 연결 중심성(Degree centrality)을 통해 의미를 해석할 수 있다(Wang & Rada, 1998). 의미 연결망 분석은 특정 주제에서 나타난 단어들의 구조를 파악하고 의미 체계와 패턴 등을 분석할 수 있어 사회과학 분야에서 유용한 방법으로 활용되고 있다(이희지 등, 2022). 따라서, 본 연구에서는 이벤트 스포츠 관광의 핵심 단어 간의 연결 관계 및 구조를 분석하기 위하여 의미 연결망 분석을 실시하였다.

5)

LDA 토픽 모델링(LDA Topic Modeling)

토픽 모델링이란 비구조화된 문서에서 잠재된 주제들을 찾기 위해 개발된 통계 추론 방법으로, 각 문서를 주제의 확률적 혼합체로 가정하고 각 주제를 단어의 분포로 표현함으로써 문서의 구조를 예측할 수 있는 분석 모델이다(박자현, 송민, 2013). 본 연구에서는 토픽 모델링 분석 기법 중에서 잠재 디리클레 할당(Latent Dirichlet Allocation; LDA)을 채택하였다.

LDA는 토픽 모델링의 가장 대표적인 기법으로, 단어들의 확률을 통해 문서 집합 내에서 잠재된 주제들을 찾아내는 기법이다(김태경, 최회련, 이홍철, 2016). LDA는 문서, 단어 등 관찰된 변수들을 통해 문서의 구조 등 보이지 않는 변수를 추론하는 방법으로 각 단어가 주제에 포함될 확률, 문서 내에서의 주제 비율, 전체 문서 집합의 주제 등을 분석할 수 있다(박자현, 송민, 2013). 본 연구에서는 이벤트 스포츠 관광 경험 이후 스포츠 이벤트와 관련하여 어떠한 주제들과 단어들이 형성되는지 파악하기 위하여 LDA 토픽 모델링을 실시하였다.

6)

감성 분석(Opinion Mining)

감성 분석이란 문서 내 단어들의 표현 등을 통해 해당 주제에 대한 작성자의 감성 종류(긍정, 부정 등)나 감정의 강도를 분석하는 기법이다(Wang, Zhang, & Zhai, 2011). 또한 단순히 긍정 및 부정과 같이 상반되는 극성의 분류부터 기쁨, 슬픔, 흥분, 놀람 등 다양한 감정을 범주화할 수 있으며(서상현, 김준태, 2016), 해당 감정과 관련된 단어들을 추출하여 작성자의 의도나 태도를 분석할 수 있다(윤호민, 최규완, 2021). 따라서, 감성 분석은 다양한 산업 및 학술 분야에서 활용되고 있다. 본 연구에서는 스포츠 이벤트 이후 이벤트 스포츠 관광객의 구체적인 감정을 분석하기 위하여 감성 분석을 실시하였다.

3.

신뢰도 및 타당도

빅데이터 분석과 해석 과정은 분석가의 주관적인 통찰을 바탕으로 진행되기 때문에 분석가 주관의 개입 가능성이 높다(김예란, 2013). 따라서 본 연구에서는 신뢰도 및 타당도를 확보하기 위하여 데이터 수집 방법, 수집 채널 및 단위, 수집 검색어, 분석 결과 해석 등 모든 연구 과정에 있어 전문가 집단(스포츠 경영학 전공 교수 1인과 박사과정 2인) 회의를 거쳐 진행되었다.

구체적으로, 다음의 3가지 절차(이정학, 이제문, 김후년, 2019)로 진행되었다. 첫째, 본 연구의 빅데이터 분석에서 사용될 핵심 단어들의 의미를 정확하게 파악하기 위하여 핵심 단어와 연결 단어들을 확인하였다. 둘째, 본 연구에서 사용될 수집 검색어가 타당한지 확인하기 위하여 실제 수집 채널(네이버, 다음)에서 직접 검색을 실시하여 해당 검색어의 의미를 파악하였다. 셋째, 수집된 빅데이터를 정제하는 과정에 있어 주관성을 배제하고 신뢰도를 확보하고자 전문가 3인의 지속적인 논의를 통해 진행되었다.

결과

1.

데이터 수집 결과

본 연구의 목적을 달성하기 위하여 2024년 3월 17일부터 4월 17일까지의 빅데이터를 수집하였다. 수집 키워드, 수집 채널에 따른 결과는 <표 2>와 같다.

표 2.

데이터 수집 결과


키워드 채널 수집량
서울시리즈 네이버 블로그 1589(935.33KB)
네이버 카페 1154(538.98KB)
다음 블로그 327(175.98KB)
다음 카페 120(44.69KB)
총합 3190(1694.98KB)
서울시리즈+관람 네이버 블로그 1680(996.89KB)
네이버 카페 171(102.74KB)
다음 블로그 330(185.02KB)
다음 카페 1(.66KB)
총합 2182(1285.31KB)
서울시리즈+직관 네이버 블로그 1230(723.41KB)
네이버 카페 182(95.76KB)
다음 블로그 329(182.49KB)
다음 카페 23(13KB)
총합 1764(1014.66KB)
2.

단어 빈도, TF-IDF 분석 결과

먼저, 본 연구에서 이벤트 스포츠 관광에 대한 단어들의 빈도를 파악하여 상위 50개 단어를 추출하였으며, 워드 클라우드를 통해 시각화하였다<그림 1>. 또한 단순 빈도분석의 한계를 보완하고자 TF-IDF 분석을 함께 실시하였다. 분석 결과는 <표 3>과 같다.

표 3.

단어 빈도 및 TF-IDF 결과


순위 단어 빈도 TF-IDF
1 서울시리즈 5929 2386.467
2 경기 3296 3337.545
3 서울 3101 2490.493
4 다저스 2775 3271.033
5 시리즈 2274 2299.077
6 고척 2016 2801.329
7 오타니 1604 2876.129
8 관람 1561 2222.666
9 직관 1543 2416.428
10 야구 1498 2421.856
11 개막전 1387 2408.102
12 월드투어 1333 2314.348
13 샌디에이고 1296 2378.56
14 파드리스 1253 2226.772
15 메이저리그 1252 2303.818
16 한국 1055 1997.370
17 선수 1029 2133.668
18 스카이돔 1024 1897.918
19 후기 992 1858.156
20 시간 877 1749.319
21 티켓 837 1890.190
22 이번 679 1458.250
23 679 1552.260
24 시즌 679 1584.941
25 팀코리아 675 1678.991
26 김하성 662 1657.394
27 중계 643 1739.191
28 개막 627 1493.968
29 스페셜 597 1489.106
30 미국 514 1296.557
31 사진 502 1295.826
32 쿠팡플레이 486 1310.388
33 시작 466 1179.938
34 작품 466 1318.500
35 게임 452 1249.169
36 유니폼 449 1306.703
37 공연 445 1420.485
38 사람 434 1149.769
39 입장 431 1212.553
40 419 1149.173
41 예매 414 1182.231
42 판매 409 1277.986
43 가격 389 1065.741
44 추천 388 1138.826
45 우리 375 1047.907
46 정보 374 1069.250
47 히어로즈 371 1083.629
48 생각 367 1016.490
49 일정 354 1073.792
50 홈런 348 1091.951
img/PICF990.png

그림 1.

워드 클라우드 분석 결과


단어 빈도분석 결과, 서울시리즈(5929), 경기(3296), 서울(3101), 다저스(2775), 시리즈(2274), 고척(2016), 오타니(1604), 관람(1561), 직관(1543), 야구(1498), 개막전(1387), 월드투어(1333), 샌디에이고(1296), 파드리스(1253), 메이저리그(1252) 등의 순으로 나타났다. 다음으로 TF-IDF 분석 결과 경기(3337.545), 다저스(3271.033), 오타니(2876.129), 고척(2801.329), 서울(2490.493), 야구(2421.856), 직관(2416.428), 개막전(2408.102), 서울시리즈(2386.467), 샌디에이고(2378.56), 월드투어(2314.348), 메이저리그(2303.818), 시리즈(2299.077), 파드리스(2226.772) 등의 순으로 나타났다. ‘경기’, ‘다저스’, ‘오타니’ 등의 경우 출현 빈도에 비해 TF-IDF 지수가 높게 나타났으며, ‘서울시리즈’, ‘서울’, ‘시리즈’ 등의 경우 출현 빈도에 비해 TF-IDF 지수가 낮게 나타났다.

3.

의미 연결망 분석 결과

먼저, 의미 연결망 분석 전 이벤트 스포츠 관광에 대한 네트워크의 구조적 속성을 살펴보았다. 단어의 동시 출현 빈도가 200회 이상인 단어들만 추출한 결과, 네트워크의 규모를 측정하는 노드는 47개, 노드의 총 연결 관계의 수를 의미하는 엣지는 402개로 나타났다. 다음으로 의미 연결망 분석 결과, 서울시리즈(.88)가 가장 높은 연결 중심성 값을 가지는 것으로 나타났으며, 경기(.64), 다저스(.54), 서울(.52), 고척(.40), 야구(.34) 등의 순으로 연결 중심성이 높은 것으로 나타났다. 전반적인 의미 연결망 분석 결과는 <그림 2>와 같다.

img/PICF9C0.png

그림 2.

의미 연결망 분석 결과


4.

LDA 토픽 모델링 결과

본 연구에서는 LDA 기법을 적용하여 토픽 모델링 분석을 실시하였으며(α = .10, β = .01), 확률 분포(Probability distribution) 값을 기준으로 대표 주제를 선정하였다(김남규, 장승현, 이근모, 2022). 우선, 최적의 토픽 개수를 판단하기 위하여 복잡도(Perplexity)와 응집도(Coherence)를 계산하였다. 그 결과, 이벤트 스포츠 관광과 관련된 토픽의 수는 4개가 적절한 것으로 판단하여 분석을 진행하였다. 구체적인 토픽 명과 토픽 핵심어는 <표 4>에 제시하였다.

표 4.

토픽 모델링 결과


토픽 데이터 정제
Topic 1:
관람 정보 속성
경기, 고척, 다저스, 오타니, 관람, 직관, 후기, 스카이돔, 야구, 선수, 티켓, 입장, 예매
Topic 2:
개최 지역 속성
서울, 시간, 한국, 예술, 도시, 추천, 문화, 기간, 세계, 여행, 장소, 사진
Topic 3:
라이센싱 상품 속성
판매, 정보, 가격, 등급, 할인, 상품, 거래, 구매, 팝업, 유니폼, 가능, 사이즈, 네이버, 진행, 제품
Topic 4:
관련 이슈 속성
샌디에이고, 파드리스, 개막전, 서울시리즈, 월드투어, 메이저리그, 손예진, 공연, 중계, 현빈, 송중기, 팀, 부부

첫 번째 토픽에서는 ‘경기’, ‘다저스’, ‘오타니’, ‘관람’, ‘직관’, ‘후기’, ‘스카이돔’, ‘야구’ 등의 핵심어가 나타났다. 이 핵심어들은 이벤트 스포츠 관광 요소 중 스포츠 이벤트 관람 요소와 관련된 핵심어로서, 관련된 정보나 인기가 많은 구단 및 선수를 중심으로 토픽이 도출되었다. 따라서, 첫 번째 토픽은 ‘관람 정보 속성’으로 명명하였다.

두 번째 토픽에서는 ‘서울’, ‘시간’, ‘한국’, ‘예술’, ‘도시’, ‘문화’, ‘여행’, ‘장소’ 등의 핵심어가 나타났다. 이러한 핵심어들을 살펴보면 스포츠 이벤트가 개최되는 국가 및 지역과 관련된 단어들을 중심으로 토픽이 도출되었음을 알 수 있다. 따라서, 두 번째 토픽은 ‘개최 지역 속성’으로 명명하였다.

세 번째 토픽에서는 ‘판매’, ‘정보’, ‘가격’, ‘등급’, ‘할인’, ‘상품’, ‘거래’, ‘구매’ 등의 핵심어가 나타났다. 이러한 핵심어들을 살펴보면, 유니폼 등과 같이 해당 구단이나 선수의 라이센싱(licensing) 상품과 관련된 단어들을 중심으로 토픽이 도출되었음을 알 수 있다. 따라서, 세 번째 토픽은 ‘라이센싱 상품 속성’으로 명명하였다.

마지막으로, 네 번째 토픽에서는 ‘샌디에이고’, ‘파드리스’, ‘메이저리그’, ‘손예진’, ‘공연’, ‘중계’, ‘송중기’, ‘부부’ 등의 핵심어가 나타났다. 이러한 핵심어들을 살펴보면 스포츠 이벤트에서 이슈가 되는 속성들(예: 연예인의 직관이나 공연 등)을 중심으로 토픽이 도출되었음을 알 수 있다. 따라서, 네 번째 토픽은 ‘관련 이슈 속성’으로 명명하였다.

5.

감성 분석 결과

이벤트 스포츠 관광에 대한 감성 분석 결과, 긍정 비율 75.29%, 부정 비율 24.71%로 긍정 비율이 부정 비율보다 약 3배 이상 높게 나타났다. 긍정 단어로는 추천(360), 기대하다(224), 원하다(211), 새롭다(199), 멋지다(194) 등의 순서로 나타났으며, 부정 단어로는 아쉽다(154), 울다(87), 힘들다(84), 어렵다(71) 등의 순서로 나타났다. 세부 감성 결과로는 호감(Good feeling)이 36.57%로 가장 높게 나타났으며, 흥미(Interest) 23.64%, 기쁨(Joy) 15.08%, 슬픔(Sadness) 9.16%, 거부감(Disgust) 8.02% 등의 순으로 나타났다. 구체적인 감성 분석의 결과는 <표 5>와 같다.

표 5.

감성 분석 결과


구분 빈도 빈도 비율(%)
긍정 4609/6122 75.29
부정 1513/6122 24.71
긍정단어 빈도 부정단어 빈도
추천 360 아쉽다 154
기대하다 224 울다 87
원하다 211 힘들다 84
새롭다 199 어렵다 71
멋지다 194 난해하다 50
특별하다 176 걱정하다 37
현대적 157 자책하다 37
사랑스럽다 150 심하다 36
최고다 147 부족하다 27
재미있다 144 주의 27
세부감성 빈도 빈도비율(%)
호감 2239 36.57
흥미 1447 23.64
기쁨 923 15.08
슬픔 561 9.16
거부감 491 8.02
두려움 195 3.19
놀람 120 1.96
분노 96 1.57
통증 50 0.82
총합 6122 100

논의

본 연구는 소셜 빅데이터를 활용하여 이벤트 스포츠 관광에 대한 관광객의 경험을 탐색함으로써 향후 이벤트 스포츠 관광 활성화에 유용한 자료를 제시하고자 하였다. 이를 위해 최근 한국에서 개최된 MLB 월드투어 서울시리즈 후기 글을 대상으로 텍스톰과 R을 활용하여 연구를 진행하였다. 구체적인 논의는 다음과 같다.

1.

단어 빈도, TF-IDF, 의미 연결망 분석 결과

먼저, 이벤트 스포츠 관광에 대한 단어 빈도 분석 결과 ‘서울시리즈’, ‘경기’, ‘서울’, ‘다저스’, ‘시리즈’, ‘고척’ 등의 키워드가 상위에 노출되었다. 소셜 빅데이터상에서 노출된 단어의 빈도가 높다는 것은 대중들의 관심 정도가 높다고 해석할 수 있다(McKinsey, 2011). 따라서, 이벤트 스포츠 관광객은 해당 스포츠 이벤트, 스포츠 이벤트에서 진행되는 경기, 스포츠 이벤트 관련 구단, 스포츠 이벤트 개최지 순으로 관심도가 높다는 것으로 판단할 수 있다.

다음으로, 이벤트 스포츠 관광에 대한 TF-IDF 분석을 실시한 결과 ‘경기’, ‘다저스’, ‘오타니’, ‘고척’, ‘서울’, ‘야구’, ‘직관’ 등의 순서로 TF-IDF 값이 높은 것으로 나타났다. TD-IDF 값이 클수록 해당 키워드가 포함된 문서에서 중요하다고 해석할 수 있다(김선희, 김범, 서일한, 2022). 특히, ‘경기’, ‘다저스’, ‘오타니’, ‘메이저리그’, ‘선수’의 경우 단어의 출현 빈도 순위보다 TF-IDF 값 순위가 더 높게 나타났다. 이는 이벤트 스포츠 관광객은 스포츠 이벤트에서 개최되는 경기, 인기 스포츠 구단 및 선수 등에 실질적으로 관심도가 높으며 이러한 요소들을 더욱 중요하다고 생각하는 것으로 해석할 수 있다.

마지막으로 의미 연결망 분석 결과 ‘서울시리즈’, ‘경기’, ‘다저스’, ‘서울’, ‘고척’, ‘야구’ 등의 순서로 연결 중심성 값이 높은 것으로 나타났다. 이는 앞서 수행한 단어 빈도 분석, TF-IDF 분석과 대체로 유사한 결과가 도출된 것으로 판단된다. 따라서, 이벤트 스포츠 관광과 함께 나타나는 핵심 단어는 해당 스포츠 이벤트 명, 스포츠 이벤트에서 진행되는 경기, 인기 스포츠 구단 및 선수, 스포츠 이벤트 개최지 등이며 이러한 핵심 단어들을 바탕으로 단어들의 연결 구조가 형성되는 것으로 판단된다. 이러한 핵심 단어 중에서도 경기, 구단, 선수에 대한 중요도가 높은 것으로 나타났는데, 이는 MLB 월드투어 서울시리즈에서 진행되는 경기 종목인 ‘야구’와, 다저스와 오타니처럼 한국에서 화제성이 높은 대상에 대한 관심도와 중요도가 높게 나타난 것으로 판단된다.

‘서울시리즈’, 경기’, ‘야구’ 등에 대한 단어의 빈도 및 TF-IDF가 높게 도출된 결과의 경우 메가 스포츠 이벤트의 경기 내용에 대한 관광객의 중요도와 만족도가 높게 나타난다는 것을 검증하여 스포츠 이벤트에서 경기 자체에 대한 자원을 더 많이 투입해야 할 것을 제시한 최종률, 안덕수, 송기문(2019)의 연구와 맥을 나란히 한다. 또한, ‘다저스’, ‘오타니’ 등에 대한 단어의 빈도 및 TF-IDF가 높게 도출된 결과의 경우 스포츠(축구) 이벤트의 스타 선수가 관계의 질에 긍정적인 영향을 미친다는 것을 검증하여 스타 선수를 통해 잠재적인 소비자들의 관심을 불러일으켜 경기장으로 유인할 수 있음을 제시한 남재준(2020)의 연구와 일맥상통하는 내용을 제시하고 있다.

2.

LDA 토픽 모델링 분석 결과

이벤트 스포츠 관광객의 경험에 대한 LDA 토픽 모델링 분석 결과, 총 4개의 토픽이 도출되었다. 구체적으로 첫 번째 토픽은 ‘경기’, ‘고척’, ‘관람’, ‘직관’, ‘후기’, ‘야구’, ‘선수’, ‘티켓’, ‘입장’, ‘예매’ 등의 키워드로 구성된 ‘관람 정보 속성’이 도출되었다. 이는 이벤트 스포츠 관광객들은 관광 경험 이후 스포츠 이벤트 경기와 관련된 정보(예. 야구, 티켓, 입장 등)들을 바탕으로 담론을 형성한다는 것으로 해석할 수 있다. 특히, 온라인에서는 공간상의 제약이 없기에 다양한 정보를 제공 및 공유하고 있으며 이벤트 스포츠 관광객의 경우 선택에 앞서 스포츠 이벤트에 대한 정보를 획득하고 관광 여부를 결정한다(구강본, 석강훈, 2010). 이러한 정보 탐색 및 제공의 관계는 주체적으로 변경될 수 있으며, 본 연구의 맥락에서 이벤트 스포츠 관광의 선험자가 이후 참여자에게 스포츠 이벤트와 관련된 정보를 제공하는 역할을 하는 것으로 판단된다. 또한, 스포츠 이벤트(행사)와 직접적으로 관련된 정보들은 만족도, 재구매(관람) 행동 등에 큰 영향을 미친다는 것을 검증한 선행연구를 바탕으로(고호석, 2009; 조우정, 2011) 소비자 행동 형성에 있어 중요한 요인임을 시사한다.

두 번째 토픽은 ‘서울’, ‘시간’, ‘한국’, ‘후기’, ‘예술’, ‘도시’, ‘추천’, ‘문화’, ‘여행’ 등의 키워드로 구성된 ‘개최 지역 속성’이 도출되었다. 스포츠 이벤트 개최는 긍정적인 유, 무형적 효과를 불러 일으키며(Kim et al., 2020; Han et al., 2022; Kim et al. 2019; 김대환, 김방출, 2019; 김대환, 김하니, 2019), 개최 국가 및 지역에도 긍정적인 영향을 가져다줄 수 있다. 스포츠 이벤트 개최가 개최지 이미지에 긍정적인 영향을 미친다는 것은 다양한 선행연구를 통해 검증되어 왔다(김영수, 김성환, 김윤숙, 2023; 민두식 등, 2020). 장태순(2008)은 스포츠 이벤트가 영구적인 수준의 지역 관심도를 유발하여 지역 전통과 가치를 강화할 수 있음을 제시하였다. 따라서, 본 연구의 결과를 통해 실질적으로 이벤트 스포츠 관광객이 관광 경험 이후 개최 지역에 대한 담론을 형성한다는 것을 검증하였다고 판단된다.

세 번째 토픽은 ‘판매’, ‘정보’, ‘가격’, ‘등급’, ‘할인’, ‘상품’, ‘거래’, ‘구매’, ‘팝업’, ‘유니폼’ 등의 키워드로 구성된 ‘라이센싱 상품 속성’이 도출되었다. 특히 MLB는 패션 기업이 스포츠라는 매개체를 통해 기업 이미지 개선, 스포츠 용품 소비 등 긍정적인 효과를 얻는 브랜드 라이센싱의 대표적인 사례이다(심우택, 신선윤, 2017). MLB 월드투어 서울시리즈의 경우, 스포츠 이벤트 현장에서 MLB 굿즈샵 슈퍼스토어를 운영하여 일 매출 9억원을 달성하였다(조정희, 2024). 또한, 뉴발란스는 서울시리즈를 기념하는 팝업스토어를 마련하여 다양한 상품과 콘텐츠를 구성하였으며 MLB 코리아는 서울시리즈를 기념하는 한정판 모자를 출시하여 사전 주문 전량 매진을 기록했다. 이러한 유통업계의 마케팅 전략을 통해 이벤트 스포츠 관광객의 주목을 이끌어 머천다이징 및 라이센싱 상품에 대한 담론이 형성된 것으로 판단된다. 전호문(2005)은 스포츠 이벤트 관광객의 소비지출을 분석하여 패턴 및 경제적 파급효과를 제시하였다. 분석 결과, 지출 패턴 중 숙박 다음으로 쇼핑에 대한 소비 자출이 높은 것으로 나타났다. 이러한 결과를 통해 스포츠 이벤트 관광객은 관련된 상품에 대한 담론을 형성할 뿐만 아니라 실질적인 소비까지 이어질 수 있다는 것을 시사한다.

네 번째 토픽은 ‘샌디에이고’, ‘파드리스’, ‘개막전’, ‘서울시리즈’, ‘월드투어’, ‘메이저리그’, ‘손예진’, ‘공연’, ‘현빈’, ‘송중기’ 등의 키워드로 구성된 ‘관련 이슈 속성’이 도출되었다. 이는 이벤트 스포츠 관광객이 관광 경험 이후 해당 스포츠 이벤트와 관련 이슈들을 바탕으로 담론을 형성한다는 것으로 해석할 수 있다. 스포츠 이벤트가 자신의 국가에서 개최되는 것만으로도 큰 이슈가 될 수 있지만, 선호하는 구단(예: 샌디에이고 파드리스)이나 다양한 이벤트(예: 공연), 그리고 대중들의 관심을 이끄는 요소들(예: 손예진 현빈 부부의 직관) 등 다양한 이슈가 함께 나타날 수 있다. 이러한 결과는, 스포츠 이벤트 관광객은 다양한 요인 중 스포츠 이벤트의 특이성과 독특함과 같은 요인들을 중요하게 생각한다는 것을 검증한 김민철, 이율(2010)의 연구와 일맥상통한다.

3.

감성 분석 결과

이벤트 스포츠 관광에 대한 관광객의 감정을 살펴보기 위하여 감성 분석을 실시한 결과 긍정 비율 75.29%, 부정 비율 24.71%로 나타났다. 긍정 단어는 주로 ‘추천’, ‘기대하다’, ‘원하다’, ‘새롭다’, ‘멋지다’, ‘특별하다’ 등으로 이벤트 스포츠 관광에 대한 긍정적인 표현이 매우 높게 나타났다. 이러한 결과는 이벤트 스포츠 관광객은 해당 스포츠 이벤트를 경험하기 전 기대감을 가지고 있으며, 실제 새롭고 특별한 경험을 통해 스포츠 이벤트를 추천하는 긍정적 의사결정 과정의 결과에서 나타난 결과일 것으로 판단된다.

반면 부정 단어는 ‘아쉽다’, ‘울다’, ‘힘들다’, ‘어렵다’ 등으로 나타났는데, 이는 이벤트 스포츠 관광 경험의 과정에서 개인의 기대감을 충족시키지 못했거나, 불편을 느껴 발생한 감정이라 판단된다. 따라서, 스포츠 이벤트를 통한 긍정적인 효과를 창출하기 위해서는 개최 이전 정확하고 구체적인 분석을 통해 관광객들의 활력 부여를 저해하는 요인을 제거해야 할 것을 시사한다(김병식, 김성겸, 2008).

4.

연구 결과의 이론적, 실무적 시사점

본 연구의 결과를 통해 다음과 같은 이론적 시사점을 제시하고자 한다. 먼저, 본 연구는 기존 양적 연구의 미시적 관점에서 벗어나 거시적 관점에서 이벤트 스포츠 관광에 관한 다양한 사례와 다양한 변수들을 도출하고자 하였다. 이러한 과정을 통해 이벤트 스포츠 관광에 대하여 더욱 포괄적인 이해를 제시하고자 하였으며, 본 연구에서 도출한 변수들을 통해 이벤트 스포츠 관광과 관련된 후속 연구에 의미 있는 시사점을 제시하였다.

또한, 이벤트 스포츠 관광을 기획하고 있는 실무자들을 위한 다음과 같은 실무적 시사점을 논의하고자 한다. 첫째, 이벤트 스포츠 관광객은 관광 경험 이후 이벤트에서 진행되는 경기, 인기 스포츠 구단이나 선수, 스포츠 이벤트 개최지 등을 중요하게 생각하는 것으로 나타났다. 따라서 관련 실무자는 다수의 소비자들의 주목을 이끌 수 있는 경기를 매칭하고(예. 스타 플레이어 매치, 은퇴 선수 레전드 매치), 개최 국가의 대중들이 선호하는 선수나 구단을 활용하여 스포츠 이벤트를 개최해야 할 것으로 판단된다.

둘째, 이벤트 스포츠 관광객은 관광 경험 이후 관람 정보 속성, 개최 지역 속성, 라이센싱 상품 속성, 관련 이슈 속성 등을 바탕으로 스포츠 이벤트에 대한 담론을 형성하는 것으로 나타났다. 따라서 스포츠 이벤트에 대한 긍정적인 담론을 형성하기 위해서는 체계적인 예매 시스템, 경기장 입장 통제 등을 통해 관광객이 스포츠 이벤트를 관람하는 데 있어 불편함을 겪지 않도록 해야 할 것으로 판단된다. 또한, 스포츠 이벤트 개최 국가 내에서 위치적으로 접근성이 우수한 곳을 개최 지역으로 선정하거나, 대중교통 운행 증대 등 이동 수단을 충분히 마련함으로써 스포츠 이벤트 개최지에 대한 긍정적인 이미지를 형성해야 할 것으로 판단된다.

셋째, 스포츠 이벤트의 라이센싱 및 머천다이징 상품은 이벤트 스포츠 관광객뿐만 아니라 많은 대중들의 관심을 이끌며, 실질적인 수익 또한 창출하고 있다. 따라서, 관련 실무자는 스포츠 이벤트를 기념할 수 있는 한정판 상품이나 인기 있는 선수들의 상품을 제작하여 온, 오프라인을 통해 판매를 진행해야 할 것으로 판단된다. 마지막으로 관련 이슈 속성과 관련하여, 관련 실무자는 스포츠 이벤트와 함께 대중들의 주목을 이끌고 즐길 수 있는 연예인 초청 공연, 팬 사인회와 같은 선수들과 함께 진행할 수 있는 이벤트를 구성함으로써 스포츠 이벤트에 대한 관심과 만족도를 높여야 할 것으로 판단된다.

한편, 이벤트 스포츠 관광객은 관광 경험 이후 대부분 긍정적인 감정을 지니는 것으로 나타났으나, 약 25%의 부정적인 감정 또한 지니는 것으로 나타났다. 따라서, 관련 실무자는 유사한 이벤트 사례들을 구체적으로 분석하여 관광객이 어떠한 과정에서 불편함을 느꼈는지(예. 경기 시간대의 더운 날씨), 이를 어떤 방식으로 해결할 수 있는지(예. 경기 날짜 및 시간대 조정)에 대한 방안을 고려해야 할 것으로 사료된다.

결론 및 제언

본 연구는 빅데이터 분석을 통해 이벤트 스포츠 관광에 대한 관광객의 경험을 살펴보았으며, 연구 결과에 따른 결론 및 제언은 다음과 같다.

먼저, 빅데이터 분석 결과 이벤트 스포츠 관광객들은 스포츠 이벤트와 관련된 구단, 선수, 개최 지역, 종목에 대하여 자주 언급하며, 해당 키워드를 중심으로 단어들의 구조가 형성되는 것으로 나타났다. 다음으로 스포츠 이벤트와 관련된 토픽의 경우, 이벤트 스포츠 관광객들은 4개의 토픽(스포츠 이벤트 관람, 스포츠 이벤트 개최 지역, 스포츠 이벤트 관련 상품, 스포츠 이벤트 관련 정보)을 중심으로 이벤트 스포츠 관광 경험에 대한 담론을 형성하는 것으로 나타났으며, 이벤트 스포츠 관광객은 해당 스포츠 이벤트에 대하여 높은 긍정적인 감정을 가지고 있는 것으로 나타났다. 이러한 결과를 통해, 본 연구는 거시적 관점에서 이벤트 스포츠 관광에 대한 대중들의 전반적인 인식을 이해하여 스포츠 이벤트와 관련된 기존 연구의 결과를 지지하였으며 이벤트 스포츠 관광과 관련하여 어떠한 토픽들이 형성되는가 파악함으로써 관련 실무자에게 중요한 시사점을 제공하였다.

본 연구는 이벤트 스포츠 관광에 대한 이론적 및 실용적 시사점을 제시하지만, 다음과 같은 연구의 한계점을 지니고 있으며, 이에 대한 논의를 바탕으로 후속 연구를 위한 제언을 하고자 한다. 먼저, 본 연구는 MLB 월드투어 서울시리즈에 대한 관광객의 경험을 바탕으로 빅데이터 분석을 실시하였다. 현재 스포츠 이벤트는 다양하게 개최되고 있으며(예. 올림픽, 아시안 게임 등), 그러한 종류에 따라 이벤트 스포츠 관광객의 인식에도 차이가 있을 수 있다. 따라서, 후속 연구에서는 다양한 스포츠 이벤트를 고려하여 스포츠 이벤트 종류에 따른 관광객의 인식 분석을 수행한다면 보다 폭 넓은 연구 결과를 도출할 수 있을 것으로 판단된다.

마지막으로 본 연구에서는 단어 빈도 분석, TF-IDF 분석, 의미 연결망 분석, LDA 토픽 모델링, 감성 분석을 통해 이벤트 스포츠 관광객의 관광 경험에 대한 포괄적인 이해를 제시하고자 하였다. 그러나, 이러한 분석 기법들은 향후 이벤트 스포츠 관광객의 행동을 예측하기에는 한계점을 지닌다. 따라서, 후속 연구에서는 빅데이터와 인공지능 등을 함께 활용한 예측 분석(Predictive analytics)을 통해 이벤트 스포츠 관광객의 미래 행동을 효율적으로 예측할 수 있는 연구를 수행해야 할 것으로 사료된다.

참고문헌

1.

고호석(2009). 스포츠이벤트 서비스품질과 참여만족도, 재참가의도, 구전의도간의 관계. 관광연구, 24(5), 175-195.

2.

구강본, 석강훈(2010). 스포츠이벤트의 서비스 환경, 관여도 및 정보탐색의 관계. 한국스포츠산업경영학회지, 15(2), 41-53.

3.

권웅, 성윤태, 맹이섭(2016). 스포츠이벤트의 지역경제파급효과. 한국체육학회지, 55(5), 469-479.

4.

김남규, 장승현, 이근모(2022). 마리나에 대한 사회적 이슈 분석: 토픽모델링을 활용한 국내 언론 보도기사 분석을 중심으로. 한국스포츠사회학회지, 35(3), 1-18. DOI: http://dx.doi.org/10.22173/ksss.2022.35.3.1 

5.

김대환, 김방출(2019). 스포츠이벤트 자원봉사자의 직무교육, 직무배치, 직무환경이 자원봉사 만족과 재참여 및 구전 의도에 미치는 영향: 스포츠관여도의 조절효과를 중심으로. 한국체육학회지, 58(2), 231-245.

6.

김대환, 김하니(2019). 메가스포츠이벤트 및 개최국 브랜드성격이 이벤트 방문의도에 미치는 영향. 한국스포츠산업경영학회지, 24(6), 112-125. DOI: http://dx.doi.org/10.31308/kssm.24.6.8 

7.

김민수, 오승욱, 한진욱(2019). 소셜빅데이터를 이용한 레저스포츠관광 트렌드 분석. 한국체육학회지, 58(4), 259-270. DOI: http://dx.doi.org/10.23949/kjpe.2019.07.58.4.18 

8.

김민수(2023). 빅데이터 기반 스포츠이벤트의 경제적 효과 측정: 순천만정원배 테니스대회를 중심으로. 한국체육정책학회지, 21(1), 63-75.

9.

김민철, 이율(2010). 중요도-성취도 (IPA) 분석을 통한 수요자 중심의 스포츠이벤트 매력성 분석. 한국스포츠산업경영학회지, 15(1), 1-13.

10.

김병식, 김성겸(2008). 메가스포츠 이벤트 유치와 지역사회 파급효과의 관계. 한국체육과학회지, 17(2), 473-483.

11.

김선희, 김범, 서일한(2022). 빅데이터를 활용한 스포츠 활동 안전 인식에 관한 연구. 한국체육학회지, 61(4), 373-383. DOI: http://dx.doi.org/10.23949/kjpe.2022.7.61.4.26 

12.

김영수, 김성환, 김윤숙(2023). 2022 년 베이징 동계올림픽 개최효과와 협력의사, 도시브랜드이미지, 도시브랜드충성도의 관계분석. 한국체육학회지, 62(2), 89-106. DOI: http://dx.doi.org/10.23949/kjpe.2023.3.62.2.7 

13.

김예란(2013). 빅데이터의 문화론적 비판: 미셀 푸코의 생정치 개념을 중심으로. 커뮤니케이션 이론, 9(3), 166-204.

14.

김종성(2017). 스포츠관광 활성화와 빅데이터 활용에 관한 연구. 한국엔터테인먼트산업학회논문지, 11(3), 99-109.

15.

김지훈, 김로빈(2024). 스포츠관광이벤트의 서비스환경, 참여만족 및 관광이미지 관계 분석: 강원청소년동계올림픽을 중심으로. 관광진흥연구, 12, 57-73. DOI: http://dx.doi.org/10.35498/kotes.2024.se3.57 

16.

김태경, 최회련, 이홍철. (2016). 토픽 모델링을 이용한 핀테크 기술 동향 분석. 한국산학기술학회 논문지, 17(11), 670-681. DOI: http://dx.doi.org/10.5762/kais.2016.17.11.670 

17.

남재준. (2020). K-리그 관중의 축구이벤트 속성과 스타선수 요인에 따른 관계의 질 및 소비자행동 간의 구조적 관계. 한국웰니스학회지, 15(1), 23-37. DOI: http://dx.doi.org/10.21097/ksw.2020.02.15.1.23 

18.

류시영, 유선욱(2017). 소셜미디어에 나타난 강원도 관광에 대한 인식 연구: 빅데이터 분석을 중심으로: 빅데이터 분석을 중심으로. 관광연구저널, 31(2), 63-81. DOI: http://dx.doi.org/10.21298/ijthr.2017.02.31.2.63 

19.

민두식, 고정민, 이완영(2020). 국제스포츠이벤트 관람객의 체험과 지각된 가치, 관광지역이미지, 만족도, 행동의도 간 구조적 관계 규명. 한국체육학회지, 59(3), 243-261. DOI: http://dx.doi.org/10.23949/kjpe.2020.5.59.3.243 

20.

박자현, 송민(2013). 토픽모델링을 활용한 국내 문헌정보학 연구동향 분석. 정보관리학회지, 30(1), 7-32. DOI: http://dx.doi.org/10.3743/kosim.2013.30.1.007 

21.

박재환(2011). 스포츠관광이벤트의 서비스 물리적 환경과 참여만족 및 관광지이미지와의 관계. 한국스포츠산업경영학회지, 16(3), 45- 57.

22.

빈삼, 염혜정, 심수인(2021). 포스트 코로나 19 시대의 패션 소비문화에 대한 빅데이터 분석-중국 패션 네트워크인 LADYMAX. cn 의 기사를 중심으로. 패션비즈니스, 25(2), 80-97.

23.

서상현, 김준태(2016). 딥러닝 기반 감성분석 연구동향. 한국멀티미디어학회지, 20(3), 8-22.

24.

심우택, 신선윤(2017). 스포츠 이벤트 라이센싱 상품화 사업의 성공전략 방안. 한국체육학회지, 56(3), 255-269. DOI: http://dx.doi.org/10.23949/kjpe.2017.05.56.3.20 

25.

오산(2023). 디자인 분야의 연구동향 파악: 텍스트 마이닝 기법을 활용하여. 인문사회과학연구, 31(3), 173-199.

26.

윤호민, 최규완(2021). 감성분석을 활용한 레스토랑 선택속성과 만족도에 관한 연구: 외래관광객 온라인 리뷰 중심으로. 호텔경영학연구, 30(6), 99-117. DOI: http://dx.doi.org/10.24992/kjht.2021.8.30.06.99 

27.

이정학, 이재문, 김재환, 김형근(2017). 소셜미디어 빅데이터 분석을 활용한 해양스포츠 인식변화. 한국스포츠산업경영학회지, 22(1), 31-46. DOI: http://dx.doi.org/10.31308/kssm.22.1.3 

28.

이정학, 이재문, 김후년(2019). 소셜네트워크 빅데이터의 의미연결망 분석을 활용한 승부조작 키워드 분석. 체육과학연구, 30(1), 119-134.

29.

이준혁, 유승열, 신성철, 강동훈, 이순섭, 이재철. (2019). 기계학습 알고리즘을 활용한 베어링의 고장 예측 알고리즘 개발에 관한 연구. Journal of Advanced Marine Engineering and Technology (JAMET), 43(6), 455-462. DOI: http://dx.doi.org/10.5916/jkosme.2019.43.6.455 

30.

이지혜, 이정학, 이재문(2018). 빅데이터 분석을 활용한 골프의류 인식에 관한 연구. 한국체육과학회지, 27(6), 403-417. DOI: http://dx.doi.org/10.35159/kjss.2018.12.27.6.403 

31.

이학주(2024, 3월 27일). 2024년을 스포츠관광 활성화 원년으로. 내일신문. https://m.naeil.com/news/read/505590

32.

이희지, 김지훈, 이준성(2022). 소셜 빅데이터를 활용한 참여형 스포츠프로그램 인식 분석: 코로나 19 확산 이전과 이후의 소비자 인식변화를 중심으로. 한국스포츠산업경영학회지, 27(3), 101-123. DOI: http://dx.doi.org/10.31308/kssm.27.3.101 

33.

장재영(2013). 텍스트 마이닝을 위한 그래프 기반텍스트 표현 모델의 연구 동향. 한국인터넷방송통신학회 논문지, 13(5), 37-47. DOI: http://dx.doi.org/10.7236/jiibc.2013.13.5.37 

34.

장지명, 황성하(2021). 텍스트마이닝을 활용한 2020 도쿄올림픽 주요 이슈 의미연결망 분석. 한국체육학회지, 60(6), 293-307. DOI: http://dx.doi.org/10.23949/kjpe.2021.11.60.6.21 

35.

장태순(2008). 대한민국 지자체 왜 메가 이벤트 유치에 열광하는가?. 한국관광정책, (32), 68-72.

36.

전호문(2005). 스포츠이벤트관광객들의 소비지출 패턴 및 경제적 파급효과에 관한 연구. 한국스포츠산업경영학회지, 10(2), 51-62.

37.

정호윤(2023). 투사형 공공외교로서의 한국의 대 (對) 포르투갈 공공외교: 주포르투갈 한국대사관 소셜미디어 분석을 중심으로. 한국사회과학연구, 42(2), 63-86. DOI: http://dx.doi.org/10.18284/jss.2023.08.42.2.63 

38.

조우정(2011). 스포츠이벤트 평가속성이 만족도 및 재구매 행동에 미치는 영향. 한국사회체육학회지, 46(1), 297-307. DOI: http://dx.doi.org/10.51979/kssls.2011.11.46.297 

39.

조정희(2024, 4월 2일). 형지, MLB 서울시리즈 ‘슈퍼스토어’ 위탁 일매출 9억. 국제섬유신문뉴스. https://www.itnk.co.kr/news/articleView.html?idxno=73393

40.

최종률, 안덕수, 송기문(2019). IPA를 이용한 메가 스포츠 이벤트 선택속성 연구: 2018 자카르타-팔렘방 아시안게임을 중심으로. 관광레저연구, 31(5), 425-442. DOI: http://dx.doi.org/10.31336/jtlr.2019.5.31.5.425 

41.

최주현, 엄진종(2024). 텍스트 마이닝 및 CONCOR 분석을 기반으로 한 충청남도 스포츠 관광 트렌드 분석 (2010∼ 2023). 학습자중심교과교육연구, 24(3), 595-609.

42.

최현주, 최연철(2016). 빅데이터를 통해 바라본 유아 창의인성 교육 방안 연구. 어린이문학교육연구, 17(4), 601-627. DOI: http://dx.doi.org/10.22154/jcle.17.4.26 

43.

Alexandris, K., & Kaplanidou, K. (2014). Marketing sport event tourism: Sport tourist behaviors and destination provisions. Sport Marketing Quarterly, 23(3), 125-126.

44.

Gibson, H. J. (1998). Sport tourism: a critical analysis of research. Sport Management Review, 1(1), 45-76. DOI: http://dx.doi.org/10.1016/s1441-3523(98)70099-3 

45.

Global Market Insight (2024). Sports Tourism Market - By Sports (Soccer/Football, Cricket, Basketball, Tennis, Hockey), By Tourism (Active, Passive, Nostalgia), By Booking Channel (Online Booking Platforms, Direct Bookings, Travel Agencies, Social Media Platforms), By Sporting Activity, Forecast 2024 – 2032. Retrieved from https://www.gminsights.com/industry-analysis/sports-tourism-market?gclid=Cj0KCQjw0Oq2BhCCARIsAA5hubW8FVob4pMmuIZWkKrZZ9KMlKzmR9HTHnlqRB0KoVnoFK3Ue28zvEUaAu-GEALw_wcB

46.

Han, S. J., Lee, W. J., Kim, S. H., Yoon, S. H., Ryu, W. S., Pyun, H., & Kim, D. (2022). Effects of the Olympic Announcement and the Actual Event on Property Values: The Case of the 2018 PyeongChang Winter Olympic Games. Sustainability, 14(14), 8687. DOI: http://dx.doi.org/10.3390/su14148687 

47.

Hotho, A., Nürnberger, A., & Paaß, G. (2005). A brief survey of text mining. Ldv Forum, 20(1), 19-62. DOI: http://dx.doi.org/10.21248/jlcl.20.2005.68 

48.

Jing, L. P., Huang, H. K., & Shi, H. B.(2002). Improved feature selection approach TFIDFin text mining. In Proceedings. International onference on Machine Learning andCybernetics. IEEE, 2, 10.1109/ICMLC.2002.1174522 DOI: http://dx.doi.org/10.1109/icmlc.2002.1174522 

49.

Julia, S., & David, R.(2019). R로 배우는 텍스트 마이닝, (박진수 역), 서울: 제이펍. (원서출판 2017).

50.

Kim, D., Kim, H., Huang, Y., & Kim, J. J. (2020). Structural Relationship between Brand Personality of Winter Olympics and Host Nation, Image Fit, and Loyalty. International Journal of Human Movement Science, 14(2), 109-122. DOI: http://dx.doi.org/10.23949/ijhms.2020.12.14.2.7 

51.

Kim, M., Kim, H., & Kim, D. (2022). Volunteers of mega-events as co-creators of host destinations: Volunteers’ experience, value, and satisfaction toward host destination. Tourism Management Perspectives, 44, 101044. DOI: http://dx.doi.org/10.1016/j.tmp.2022.101044 

52.

Kim, D., Park, C., Kim, H., & Kim, J. (2019). Determinants and outcomes of volunteer satisfaction in mega sports events. Sustainability, 11(7), 1859. DOI: http://dx.doi.org/10.3390/su11071859 

53.

McKinsey, G. I. (2011). Big data: The Next Frontier for Innovation, Methods Research in Special Education and Beyond. Learning Competition and Productivity. McKinsey Global Institute.

54.

O’Brien, D., & Chalip, L. (2007). Executive training exercise in sport event leverage. International Journal of Culture, Tourism and Hospitality Research, 1(4), 296-304.

55.

Wang, H., Zhang, D., & Zhai, C. (2011). Structural topic model for latent topical structure analysis. Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics, 1526-1535.

56.

Wang, W., & Rada, R. (1998). Structured hypertext with domain semantics. ACM Transactions on Information Systems (TOIS), 16(4), 372-412. DOI: http://dx.doi.org/10.1145/291128.291132 

57.

Youn, T., & Lee, S. (2018). Text Analytics with Python. Seoul: Neulbom.